1,462 research outputs found
Modelização paramétrica de sinais para aplicação em sistemas de conversão texto-fala
Neste trabalho foi desenvolvido um sistema de extracção automática de parâmetros de sinais de fala recorrendo a ferramentas de análise cepstral, de predição linear quer pela matriz autocorrelação quer pela matriz covariância, e ao método de análise sÃncrona com o perÃodo fundamental.
Realiza-se uma segmentação e classificação dos sinais em vocalizados, não vocalizados ou silêncio. Aos segmentos com conteúdo de fala atribuem-se modelos baseados em formantes.
Os parâmetros definidos pelo modelo para a fala vocalizada são 4 formantes e respectivas larguras de banda, frequência fundamental e amplitude. Para os sons não vocalizados considerou-se um modelo com um pólo, um zero e excitação com sinal de ruÃdo aleatório.
O método de análise cepstral segmenta o sinal com comprimentos fixos e analisa individualmente cada segmento. A análise de cada segmento consiste na separação das caracterÃsticas do trato vocal e da fonte excitadora, recorrendo a uma função de "lifteragem" nas quefrências sendo determinada a frequência fundamental da fonte excitadora ("pitch") e alisado o espectro relativo ao trato vocal. A partir deste espectro alisado ou envelope espectral é aplicado um algoritmo de determinação dos picos para extrair as frequências formantes das ressonâncias do trato vocal obedecendo a constrições respeitantes à s regiões de frequências de cada formante e à s amplitudes relativas dos respectivos picos. São também determinadas as correspondentes larguras de banda a 3 dB a partir do envelope espectral.
Os métodos de predição linear analisam também individualmente cada segmento de comprimento fixo do sinal de fala, obedecendo a um modelo só com pólos, determinando os coeficientes de predição linear por multiplicação matricial. A partir destes coeficientes são determinados os pólos. Cada par de pólos complexos conjugados é considerado um possÃvel formante, sendo posteriormente seleccionados justamente 4 formantes por um processo de eliminação das frequências formantes que não têm a correspondência de um pico na função de transferência do sistema.
O método de análise sÃncrona com o perÃodo fundamental determina o sincronismo com o impulso glotal segmentando o sinal em troços de duração de um perÃodo, sendo estes posteriormente analisados pelo método de predição linear ( matriz covariância).
Posteriormente a sequência de parâmetros é sujeita a um alisamento não linear para corrigir eventuais pontos fora de uma linha definida pelos valores dos parâmetros anteriores e posteriores ("outliers").
Todos estes métodos determinam com razoável fidelidade as frequências formantes dos sinais de fala, contudo, as larguras de banda são mais correctamente determinadas pelo método de predição linear pela matriz covariância.
É ainda apresentado o desenvolvimento de um conversor texto-fala para o português baseado num sintetizador de formantes com o mesmo modelo usado na análise para os sinais vocalizados. Os principais resultados obtidos foram a realização acústica de uma lista de 37 fonemas fundamentais, regras de conversão grafema-som na forma tabular, um grupo de regras de concatenação para as estruturas acústica e temporal inerentes aos sons, regras prosódicas elementares e, pronuncia de acrónimos e numerais.
Foram ainda desenvolvidas várias ferramentas complementares à análise dos sinais de fala como sejam um espectrógrafo e um outro sintetizador de formantes, exclusivamente computacional e para testes, baseado no modelo com os mesmos parâmetros.
Os métodos desenvolvidos foram testados com sinais de fala adequadamente seleccionada e recolhida em sala insonorizada e, registados magneticamente com aparelhagem adequada.
Os resultados atingidos satisfazem os objectivos inicialmente propostos para este trabalho
Deep-learning in identification of vocal pathologies
The work consists in a classification problem of four classes of vocal pathologies using one Deep Neural
Network. Three groups of features extracted from speech of subjects with Dysphonia, Vocal Fold Paralysis,
Laryngitis Chronica and controls were experimented. The best group of features are related with the source:
relative jitter, relative shimmer, and HNR. A Deep Neural Network architecture with two levels were
experimented. The first level consists in 7 estimators and second level a decision maker. In second level of
the Deep Neural Network an accuracy of 39,5% is reached for a diagnosis among the 4 classes under analysis.info:eu-repo/semantics/publishedVersio
Organisational Structures for Cloud
CEMSTelecom companies face increasing competition and decrease in profitability. Cloud computing is one of the best markets to reverse this trend. Creating a new cloud product is however a challenge from both a product development point of view and an organisational point of view. A new cloud product focused on development through partnerships needs the appropriate organisational mechanisms to succeed. In an initial proposal a Partner Management Office was proposed. However the lack of integration between the office and the rest of the company suggested that the use of a matrix organisational structure would be a better fit. I propose a balanced matrix structure to address the duality of dimensions within the product and elaborate on how this structure should be implemented
Protótipo de eletrocardiograma móvel
As doenças cardiovasculares são a principal causa de preocupação a nÃvel mundial,
sendo a maioria resultante dos hábitos alimentares. O emergente crescimento tecnológico
na área da medicina tem sido de uma enorme importância, resultando em apostas
na área da prevenção, diagnóstico, e monitorização de muitas patologias. O recurso a
um eletrocardiograma em ambulatório permite a gravação de toda atividade elétrica
do coração enquanto o paciente desempenha normalmente as suas tarefas ("ambulatório-
liberdade de movimentos"). A monitorização em ambulatório pode ser conhecida
também por, eletrocardiograma ambulatório, Holter e ECG 24-horas. O Holter deteta
anomalias durante a execução das mais diversificadas tarefas, a monitorização contÃnua
por um longo perÃodo de tempo, possibilita o registo de toda atividade cardÃaca no
decorrer das atividades fÃsicas do dia a dia. Com presente trabalho pretende-se descrever
um sistema de monitorização de saúde tendo por base os seguintes subsistemas:
recetor de sinais vitais em tempo real, processamento de sinais vitais em tempo real,
processamento de sinais de ECG com recurso a um microcontrolador (MCU), possibilitando
a visualização da taxa de batimentos cardÃacos num LCD e posterior armazenamento
em "SDcard"do fluxo de dados digitais previamente convertidos para digital
através do MCU, para posterior visualização em PC. Desta forma a realização deste projeto
resulta no estudo de uma alternativa de baixo custo como alternativa aos dispositivos
já existentes.info:eu-repo/semantics/publishedVersio
Controlador de luz e temperatura para a criação de canários
O trabalho faz parte do desenvolvimento de um controlador de luz que permite
simular o amanhecer e anoitecer às horas definidas pelo utilizador e, simultaneamente,
controlar a temperatura. O equipamento tem como objetivo ser utilizado para criadouros
de aves em que o perÃodo reprodutivo pode ser controlado pelo número de horas
de luz. O controlo de todo o sistema é efetuado através do microcontrolador ATMEGA328P
da Atmel, juntamente com o RTC (Real Time Clock) DS1307+ da Maxim. O controlo
da simulação do amanhecer e anoitecer é efetuado através de PWM (Pulse Width
Modulation) e o controlo da temperatura através de um relé. O sistema possui também
um ecrã LCD onde são fornecidas todas as informações necessárias ao utilizador, tais
como, data, hora, temperatura, e permite ao utilizador configurar todo o equipamento
por meio de 4 botões. O equipamento tem a capacidade de efetuar dois ciclos distintos,
podendo o utilizador optar por utilizar apenas um, ou os dois ciclos. O utilizador pode
também definir o inÃcio dos ciclos no intervalo diário de 24 horas, pode definir a temperatura
alvo do criadouro, pode definir a duração dos ciclos, e pode, caso seja necessário,
ajustar as horas do relógio do equipamento. O equipamento encontra-se concluÃdo, e
encontra-se apto para ser introduzido num ambiente real.info:eu-repo/semantics/publishedVersio
Didactic speech synthesizer – acoustic module, formants model
Text-to-speech synthesis is lhe main subjecl treated
in this work. II will be presented the conslilution of a generic
lext-to-speech system conversion, explained lhe functions 01
the various modules and described lhe developmenl lechniques
using lhe formants model. The development of a didactic forman!
synthesiser under Matlab environmenl will also be described. This
didactic synthesiser is inlended for a didactic understanding of lhe
formant modelaI speech producllon
Didactic speech synthesizer – acoustic module, formants model
Text-to-speech synthesis is lhe main subjecl treated
in this work. II will be presented the conslilution of a generic
lext-to-speech system conversion, explained lhe functions 01
the various modules and described lhe developmenl lechniques
using lhe formants model. The development of a didactic forman!
synthesiser under Matlab environmenl will also be described. This
didactic synthesiser is inlended for a didactic understanding of lhe
formant modelaI speech producllon
Help system for medical diagnosis of the electrocardiogram
This presentation is part of a work that aims to create an interactive learning medical system of ECG events and pathologies diagnose. The system can be seen as an interactive game in wish the user will practice with ECG signal of several pathologies For this purpose an algorithm was developed that detects the events of the ECG in MATLAB. This paper is focus on the discussion of the algorithm, connections between the ECG and the heart physiology listing several pathologies and their respective ECG patterns. A preparatory smoothing of the signal is performed. The algorithm is now only applicable to the normal ECG. It is based in correlation of events within a period of the ECG, and finds the P wave and T wave searching the peaks under a confined region of the smoothed signal
Tourism forecasting: time-series analysis of world and regional data
This Special Issue was honored with six contribution papers embracing the subject of tourism forecasting. The papers focused on forecasting tourism demand in the USA, Vienna—Austria, Vietnam, Marrakech-Safi region of Morocco, Dubai, and China. The time series were spread from tourism interest in the USA, hotel room demand in Vienna, number of tourists in Vietnam, annual tourist arrivals to the Marrakech-Safi region of Morocco, tourist arrivals to Dubai from the UK and the daily and weekly number of passengers at urban rail transit stations in China. The used datasets, in some cases, included thepandemic period, which was a severe challenge for the forecasting models. The forecasting models used embrace the following parameters: descriptive analysis techniques, seasonal naïve, Error Trend Seasonal (ETS), Seasonal Autoregressive Integrated Moving Average (SARIMA), Trigonometric Seasonality, Box–Cox Transformation, ARMA Errors, Trend and Seasonal Components (TBATS), Seasonal Neural Network Autoregression (Seasonal NNAR), Seasonal NNAR with an external regressor, Artificial Neural Network (ANN) forecasting model, ARIMA, AR, linear regression, Support Vector Regression (SVR), eXtreme Gradient Boosting (XGBoost), Long Short-Term Memory (LSTM) models, ensemble models, Box–Jenkins time series models, and the Facebook Prophet algorithm.info:eu-repo/semantics/publishedVersio
- …